Interactions entre le calcul de collocations et la catégorisation automatique de textes

نویسندگان

  • Rémi Lavalley
  • Patrice Bellot
  • Marc El-Bèze
چکیده

In this paper we describe some interactions between collocations and automatic text categorization. First, we use the differents categories to extract strings (through collocations agglutinations) related to each categorie. Then we use these categories-specific strings to improve categorization. MOTS-CLÉS : collocations, catégorisation automatique de textes.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Multi-catégorisation de textes juridiques et retour de pertinence

Résumé. La fouille de données textuelles constitue un champ majeur du traitement automatique des données. Une large variété de conférences, comme TREC, lui sont consacrées. Dans cette étude, nous nous intéressons à la fouille de textes juridiques, dans l’objectif est le classement automatique de ces textes. Nous utilisons des outils d’analyses linguistiques (extraction de terminologie) dans le ...

متن کامل

Utilisation de WordNet dans la catégorisation de textes multilingues

La Catégorisation de Textes (C.T) consiste à assigner une ou plusieurs catégories parmi une liste prédéfinie à un document. En d’autres termes, elle permet de chercher une liaison fonctionnelle entre un ensemble de textes et un ensemble de catégories (Sebastiani (2002)). La grande importance accordée cette dernière décennie au traitement des données multilingues, a donné naissance à un nouveau ...

متن کامل

Extraction automatique de connaissances pour la décision multicritère. (Automatic Knowledge Extraction pour Multicriteria Decision Making)

Cette application, sans prendre parti, aborde le sujet délicat qu’est l’automatisation cognitive. Elle propose la mise en place d’une chaîne informatique complète pour supporter chacune des étapes de la décision, en particulier la phase d’apprentissage en faisant de la connaissance actionnable (CA) une entité informatique manipulable par des algorithmes. La connaissance est extraite directement...

متن کامل

Exploitation de l'asymétrie entre termes pour l'extraction automatique de taxonomies à partir de textes

Résumé. Nous présentons dans cet article une nouvelle approche pour la génération automatique de structures lexicales (ou taxonomies) à partir de textes. Cette tâche est fondée sur l’hypothèse forte selon laquelle l’accumulation de faits statistiques simples sur les usages en corpus permet d’approximer des informations de niveau sémantique sur le lexique. Nous utilisons la prétopologie comme ca...

متن کامل

Bacteriological Study of Asymptomatic Urinary Tract Infections in Pregnant Women in Tehran

Des infections Microbiennes de l'apparell urinaire se voient beaucoup en periode de gros­sesse.  Chez 25% des femmes enceintes, la bacteru­rie sans symptomes aboutit a une infection sym­ptomatique des voiles urinaires dans les mois ulterieurs de la grossesse, c'est pour cette raison qu'il est utile de demander, comme routine, des examens bacteriologiques d'urine, surtout pen­dant la grossesse....

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009